Model Selection

wav2vec2 Fine-tuning

# wav2vec2 Fine-tuning

Deepfake Audio Detection V1

A deepfake audio detection model fine-tuned based on wav2vec2-base, achieving 99.66% accuracy

Audio Classification

Zeyadd-Mostaffa

A noise recognition model fine-tuned from facebook/wav2vec2-base with 93.89% accuracy

Audio Classification

My Awesome Mind Model

An audio classification model fine-tuned on the minds14 dataset based on facebook/wav2vec2-base

Audio Classification

Wav2vec2 Large Lv60 Phoneme Timit English Timit 4k 002

A fine-tuned English phoneme recognition model based on facebook/wav2vec2-large-lv60 on the TIMIT dataset, achieving a phoneme error rate of 10.53%

Speech Recognition

Transformers English

Speechbrain Emotion Recognition Openvino

This model uses a fine-tuned wav2vec2 (base) architecture, trained on the IEMOCAP dataset for speech emotion recognition tasks.

Audio Classification English

Wav2vec Base Crema Sentiment Analysis

A speech emotion analysis model fine-tuned based on facebook/wav2vec2-base, achieving 70.87% accuracy on the evaluation set

Audio Classification

Wav2vec2 Base Arabic Speech Emotion Recognition

A fine-tuned Arabic speech emotion recognition model based on facebook/wav2vec2-base, achieving 99.92% accuracy on the evaluation dataset.

Audio Classification

ahmmedasaad2772

Wav2vec2 Large Xlsr 53 English Finetuned Ravdess

A speech emotion recognition model fine-tuned on the RAVDESS dataset based on the wav2vec2-large-xlsr-53-english model

Audio Classification

My Awesome Mind Model

An audio classification model fine-tuned based on facebook/wav2vec2-base, achieving 58.92% accuracy on the evaluation set

Audio Classification

Wav2vec2 Audio Emotion Classification

A fine-tuned audio emotion classification model based on facebook/wav2vec2-base, achieving 73.98% accuracy on the evaluation set

Audio Classification

Wav2vec2 Base Music Speech Both Classification Finetuned Gtzan

Audio classification model based on wav2vec2 architecture, fine-tuned on the GTZAN dataset for music and speech classification tasks

Audio Classification

Wav2vec2 Base Finetuned Gtzan

This model is an audio classification model fine-tuned on the GTZAN dataset based on facebook/wav2vec2-base, primarily used for music genre classification tasks.

Audio Classification

Finetuned Wav2vec2.0 Base On IEMOCAP 2

This is a speech emotion recognition model based on the facebook/wav2vec2-base model fine-tuned on the IEMOCAP dataset, achieving 73.9% accuracy on the evaluation set.

Audio Classification

A speech emotion recognition model fine-tuned based on facebook/wav2vec2-base, achieving 73.22% accuracy on the evaluation set

Audio Classification

Bird Classification Model

An audio classification model fine-tuned based on facebook/wav2vec2-base for identifying bird sounds

Audio Classification

Iewav2vec2 Finetuned On Shemo

This model is a fine-tuned version of minoosh/wav2vec2-base-finetuned-ie on the shEMO dataset, primarily used for speech emotion recognition tasks.

Audio Classification

Wav2vec2 Base Speech Emotion Recognition

A speech emotion recognition model fine-tuned based on facebook/wav2vec2-base, used to predict the speaker's emotions in audio samples.

Audio Classification

Transformers English

Audio Class Finetuned

This model is a fine-tuned audio classification model based on facebook/wav2vec2-base on the superb dataset, achieving an accuracy of 0.6578 on the evaluation set.

Audio Classification

Wav2vec2 Base Finetuned Ks

A speech recognition model fine-tuned on the superb dataset based on facebook/wav2vec2-base, achieving 98.34% accuracy

Speech Recognition

Ser Model Fixed Label

A speech emotion recognition model fine-tuned based on facebook/wav2vec2-base, achieving an accuracy of 83.67% on the evaluation set

Audio Classification

Englishspeechtotext

Fine-tuned English speech recognition model based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Wav2vec2 Base Finetuned Ks

This model is a speech recognition model fine-tuned on the SUPERB dataset based on facebook/wav2vec2-base, demonstrating excellent performance in keyword spotting tasks.

Speech Recognition

Wav2vec2 Large Emotion Detection German

A German speech emotion detection model based on wav2vec2, trained on the emo-DB dataset, capable of recognizing 7 different emotions.

Audio Classification

Transformers German

Wav2vec2 Base Finetuned Ks

A speech recognition model fine-tuned on the superb dataset based on wav2vec2-base, achieving 98.15% accuracy

Audio Classification

Wav2vec2 Base Intent Classification Ori F1

This model is a speech intent classification model fine-tuned from facebook/wav2vec2-base, achieving an F1 score of 0.875 on the evaluation set.

Audio Classification

MuhammadIqbalBazmi

Wav2vec2 Large 960h Intent Classification Ori

Fine-tuned intent classification model based on facebook/wav2vec2-large-960h, achieving 77.08% accuracy on the evaluation set

Audio Classification

MuhammadIqbalBazmi

Wav2vec2 Base Intent Classification Ori

This model is a fine-tuned version of facebook/wav2vec2-base on the intent-dataset for intent classification tasks.

Audio Classification

MuhammadIqbalBazmi

My Awesome Minds Model

A speech recognition model fine-tuned on the minds14 dataset based on facebook/wav2vec2-base

Speech Recognition

Urdu Audio Emotions

A fine-tuned Urdu audio emotion classification model based on facebook/wav2vec2-large-xlsr-53, supporting recognition of four emotions: anger, happiness, calmness, and sadness.

Audio Classification

Wav2vec2 Base Timit Demo Colab

A speech recognition model fine-tuned on the TIMIT dataset based on the facebook/wav2vec2-base model, featuring a low Word Error Rate (WER).

Speech Recognition

Wav2vec2 Base Timit Demo Google Colab

A speech recognition model fine-tuned on the TIMIT dataset based on facebook/wav2vec2-base, specializing in English speech-to-text tasks

Speech Recognition

Wac2vec Lllfantomlll

A speech recognition model fine-tuned based on facebook/wav2vec2-base, achieving a word error rate of 0.3417 on the evaluation set.

Speech Recognition

Wav2vec2 Base Timit Demo Colab53

A speech recognition model fine-tuned based on facebook/wav2vec2-base, suitable for the TIMIT dataset

Speech Recognition

Wav2vec2 Final 1 Lm 2

A fine-tuned speech recognition model based on facebook/wav2vec2-base, with a Word Error Rate (WER) of 0.283, and 0.126 when using 3-gram

Speech Recognition

One Simple Finetune Test

This model is a fine-tuned version of RuiqianLi/wav2vec2-large-xls-r-300m-singlish-colab based on the li_singlish dataset, primarily used for Singapore English speech recognition tasks.

Speech Recognition

Wav2vec2 Base Timit Demo Google Colab

This model is a speech recognition model fine-tuned on the TIMIT dataset based on facebook/wav2vec2-base, focusing on English speech-to-text tasks.

Speech Recognition

Filipino Wav2vec2 L Xls R 300m Official

A speech recognition model fine-tuned on Filipino speech datasets based on facebook/wav2vec2-xls-r-300m

Speech Recognition

Wav2vec2 Base Timit Demo Colab53

A speech recognition model fine-tuned on the TIMIT dataset based on the facebook/wav2vec2-base model, primarily used for English speech-to-text tasks.

Speech Recognition

Wav2vec2 Base Timit Demo Colab92

A speech recognition model fine-tuned on the TIMIT dataset based on the facebook/wav2vec2-base model

Speech Recognition

Wav2vec2 Base Timit Demo Colab50

This model is a fine-tuned speech recognition model based on facebook/wav2vec2-base, trained for 30 epochs on the TIMIT dataset.

Speech Recognition

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase